home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1994 March / Internet Info CD-ROM (Walnut Creek) (March 1994).iso / inet / internet-drafts / draft-ietf-uri-resource-names-01.txt < prev    next >
Text File  |  1993-10-19  |  11KB  |  257 lines

  1.  
  2. INTERNET--DRAFT                        Chris Weider
  3. IETF URI Working Group                    Merit Network, Inc.
  4. <draft-ietf-uri-resource-names-01.txt>            Peter Deutsch
  5.                             Bunyip Information
  6.                               Systems, Inc.
  7.                             October, 1993
  8.  
  9.         Uniform Resource Names
  10.  
  11. Status of this Memo
  12.  
  13. In this paper, the authors propose an identifier, called the Uniform Resource
  14. Name (URN), which is designed to provide persistent naming for resources
  15. and objects on the Internet.
  16.  
  17.         This document is an Internet Draft.  Internet Drafts are working
  18.         documents of the Internet Engineering Task Force (IETF), its Areas,
  19.         and its Working Groups.  Note that other groups may also distribute
  20.         working documents as Internet Drafts.
  21.  
  22.         Internet Drafts are draft documents valid for a maximum of six
  23.         months. Internet Drafts may be updated, replaced, or obsoleted
  24.         by other documents at any time. It is not appropriate to use 
  25.         Internet Drafts as reference material or to cite them other than
  26.         as a "working draft" or "work in progress."
  27.  
  28.         Please check the I-D abstract listing contained in each Internet
  29.         Draft directory to learn the current status of this or any 
  30.         other Internet Draft.
  31.  
  32.     This Internet Draft expires March 20, 1994.
  33.  
  34.  
  35. 1: Introduction
  36.  
  37. A Uniform Resource Name (URN) is an identifier which can be used to uniquely
  38. identify a resource, and is designed to provide persistent naming for 
  39. networked objects.  This name would stay the same no matter what the 
  40. current location(s) of the object was.
  41.  
  42. 2: Motivation
  43.  
  44. This work comes out of the discussions held at the Uniform Resource Identifier
  45. meetings at the IETF, and from further discussions among interested parties.
  46. Currently, the only standard identification scheme for resources on the Net is
  47. the Uniform Resource Locator (URL) [Berners-Lee 1993]. This "Locator"
  48. is designed to provide a uniform way of specifying location and retrieval 
  49. information for networked objects. The URL, however, will not provide a stable,
  50. long-lived reference to a resource as the resources have a bad habit of moving 
  51. out from under the locator. Also, a given resource may have multiple URLs if
  52. it resides at a number of different locations on the net, or is available
  53. under a number of different access methods. Thus it is difficult to tell,
  54. given two different URLs, whether the resources they point to are the same
  55. or different without retrieving both of them. The Uniform Resource Name, or 
  56. URN, has been designed to alleviate these problems.
  57.  
  58.  
  59. INTERNET--DRAFT        Uniform Resource Names            Weider, Deutsch
  60.  
  61. 3: The Uniform Resource Name (URN)
  62.  
  63. 3.1 Functionality
  64.  
  65. The URN is designed to provide persistent naming for objects on the net. It
  66. is intended to be used in conjunction with a directory service, which can 
  67. provide a URN -> URL mapping [Weider 1993]. This URN-URL architecture allows 
  68. permanent references to be made to resources without worrying about their 
  69. current locations. It is also intended to provide some detection of duplicates 
  70. in responses to queries of various resource location services. 
  71.  
  72. 3.2 What URNs are *not*
  73.  
  74. URNs are not required to be human-readable in the sense that a human could
  75. look at the URN and determine anything about the contents of the resource.
  76. While the Naming Authority (q.v.) has the final determination of the contents
  77. (subject to the syntax constraints), the Naming Authority is STRONGLY
  78. discouraged from placing metainformation about the resource into the resource's
  79. URN, as the URNs are not expected to be read, and because this paper will
  80. specify only five consistent components of the URN. Although there have been a 
  81. number of proposals placing extensive semantics on the contents of the URN 
  82. [Spero 1992, Kunze 1993], it was decided by the authors of all the proposals
  83. that all metainformation should be conveyed using another mechanism, and that 
  84. the Naming Authority should assume that humans will never look at the contents 
  85. of the URN to determine qualities of the resource they are retrieving, and 
  86. would not be required to guess from a given URN the URN of a document which 
  87. might be related.
  88.  
  89. 3.3 Components of the URN
  90.  
  91. There are five components to the URN, separated by colons; the keyword
  92. 'URN', a code specifying the character set encoding of the rest of the URN, a 
  93. naming authority scheme identifier, a naming authority identifier, and an 
  94. opaque string. The URN is surrounded by the characters '<' and '>', which are 
  95. part of the syntax. Each part is described below. No component of the URN 
  96. can contain the characters ':', '>', ' ', or '\'  unless they are escaped by a 
  97. backslash character '\'. 
  98.  
  99. 3.3.1 URN examples
  100.  
  101. <URN:ASCII:IANA:merit.edu:1929642>
  102.  
  103. <URN::ISBN_Publisher_ID:0_201_12:xyzx\:mnopq>
  104.  
  105. <URN:ASCII:IANA:12456:1\:<\>\:2345>
  106.  
  107. 3.3.2 The character set encoding code
  108.  
  109. This string identifies the encoding scheme used for the rest of the URN. 
  110. There is only one defined at this time, ASCII, which indicates that the
  111. rest of the URN is ASCII encoded ASCII. If this component is empty,
  112. the default encoding scheme is assumed. The default encoding scheme is
  113. ASCII.
  114.  
  115.  
  116. INTERNET--DRAFT        Uniform Resource Names            Weider, Deutsch
  117.  
  118. 3.3.3 The naming authority scheme identifier
  119.  
  120. The naming authority scheme identifier is a string which is the name of a 
  121. protocol or organization which guarantees the uniqueness of the naming 
  122. authority identifier which follows. Naming authority scheme identifiers defined 
  123. at this time are 
  124.  
  125.     IANA
  126.     ISBN_Publisher_ID
  127.  
  128. 3.3.4 The naming authority identifier
  129.  
  130. This string, along with the naming authority scheme identifier, identifies a 
  131. naming authority that may assign URNs to resources. This string may have 
  132. internal syntax depending on the naming authority scheme identifier associated 
  133. with it; for example, the naming authority identifier space associated with IANA 
  134. may be hierarchical and multi-leveled.
  135.  
  136. 3.3.5 The Opaque String
  137.  
  138. The opaque string component of the URN is any string the Naming Authority 
  139. wishes to assign to a given resource, subject only to the constraints of the 
  140. character encoding scheme. 
  141.  
  142. As mentioned above, the Naming Authority should not assume that a 
  143. human will ever read the URN. Also, the Naming Authority, in assigning an
  144. opaque string to a given resource, should keep the following guidelines in 
  145. mind:
  146.  
  147.       1: A given opaque string should be case-insensitive (for compatibility
  148.        with very old systems).
  149.  
  150.     2: A given opaque string, once assigned, should never be reused. These
  151.        are expected to be persistent names for resources (think in terms
  152.        of decades).
  153.  
  154.     3: In assigning an opaque string, and thus creating a URN, the Naming
  155.        Authority should make provisions for a URN -> URL mapping
  156.        function. This need be nothing more than finding an organization
  157.        which is already providing this service for other URNs and making
  158.        arrangements to have them translate for the new URN, or could
  159.        be as involved as creating a new software agent to provide this
  160.        service.  Remember that a name is no good without some way of 
  161.        getting a location.
  162.  
  163.     4: URNs will be returned as pointers from a resource location service.
  164.        (See [Weider 1993]). Consequently, a Naming Authority should give
  165.        some thought to the assignation of new URNs for resources which
  166.        are derived in some fashion from other resources to which that
  167.        Authority has already assigned URNs. For example, should the
  168.        Postscript version and the ASCII version of a paper have the
  169.        same URN? While there are no universally applicable answers to
  170.        questions like these (for example, should the Russian and English
  171.        versions of a scientific paper have the same URN?) an Authority
  172.        should keep in mind that users will want to weed out duplicate
  173.        resources in the lists of URNs returned by a resource location
  174.        service, and consequently will be doing a lot of equality testing
  175.        on the URNs.
  176.  
  177. INTERNET--DRAFT        Uniform Resource Names            Weider, Deutsch
  178.  
  179.     
  180. 4: Setting up as a Naming Authority
  181.  
  182. There are 2 scheme identifiers listed here; others will no doubt be suggested
  183. and added as this draft circulates. They are:
  184.  
  185.         IANA
  186.         ISBN_Publisher_ID
  187.  
  188. To set one's organization up as a Naming Authority, one can use the ISBN 
  189. publisher ID one has been assigned, or one can apply for an Enterprise
  190. Number from the IANA (Internet Assigned Number Authority) if the organization
  191. does not already have one. The general syntax is listed in section 5.
  192.  
  193. 5: Syntax
  194.  
  195. Below is a BNF like description of the syntax of the URN. Spaces have 
  196. been used here to separate components for readability, spaces are NOT ALLOWED
  197. in a syntactically correct URN unless they are escaped with the '\' character. 
  198. Square brackets '[' and ']' are used to indicate optional parts; 
  199. a vertical line "|" indicates alternatives.  Single letters and digits stand 
  200. for themselves. All words of more than one letter are either expanded further 
  201. in the syntax or represent themselves.
  202.  
  203.  
  204. urn              <URN: Encoding_Scheme:Authority_Id : opaque_string >
  205.  
  206. Authority_Id        Scheme_ID  : [Individual ]
  207. Scheme_ID        IANA | ISBN_Publisher_ID | ISSN
  208. Individual        xalphas
  209. xalphas            xalpha [ xalphas ]
  210. xalpha            a | b | c | d | e | f | g | h | i | j | k | l |
  211.             m | n | o | p | q | r | s | t | u | v | w | x |
  212.             y | z | A | B | C | D | E | F | G | H | I | J |
  213.             K | L | M | N | O | P | Q | R | S | T | U | V |
  214.             W | X | Y | Z | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
  215.             9 | 0 | - | _ | . | @
  216.  
  217. The allowed characters in the opaque string are determined by the character 
  218. set encoding code. For the code ASCII, the allowable characters are xalphas as 
  219. above, the character ':' encoded as '\:', the character '>' encoded as '\>', and 
  220. the character '\' encoded as '\\'.
  221.  
  222. 6: References
  223.  
  224. [Kunze 1993]  Kunze, John, Resource Citations for Electronic Discovery and 
  225.           Retrieval, March, 1993. Circulated to ietf-uri mailing list.
  226.  
  227. [Spero 1992]  Spero, Simon, Uniform Resource Numbers, November 1992. 
  228.           Circulated to ietf-uri mailing list.
  229.  
  230. [Weider 1993] Weider, Chris and Deutsch, Peter. A Vision of an Integrated 
  231.           Internet Information Service, March, 1993. Available as
  232.  
  233. ftp://nic.merit.edu/documents/internet-drafts/draft-ietf-iiir-vision-00.txt
  234.  
  235.  
  236.  
  237. INTERNET--DRAFT        Uniform Resource Names            Weider, Deutsch
  238.  
  239.  
  240. 7: Author's addresses
  241.  
  242. Chris Weider
  243. clw@merit.edu
  244. Merit Network, Inc.
  245. 2901 Hubbard, Pod G
  246. Ann Arbor, MI 48109
  247. Phone: (313) 747-2730
  248. Fax: (313) 747-3185
  249.  
  250. Peter Deutsch
  251. peterd@bunyip.com
  252. Bunyip Information Systems
  253. 310 St-Catherine St West
  254. suite 202,
  255. Montreal, Quebec H2X 2A1
  256. CANADA
  257.